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基于 用 户 扩展 兴趣 的 微 博 推荐 方法 
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摘 要 : 为 解决 微 博 用 户 兴趣 提取 不 准确 的 问题 ， 提 出 一 种 基于 用 户 扩展 兴趣 的 微 博 推 荐 方法 。 该 方法 将 用 户 个 体 兴 
趣 与 关联 兴趣 结合 为 用 户 扩展 兴趣 进行 微 博 推荐 。 其 中 ， 用 户 个 体 兴趣 从 用 户 标签 、 发 布 微 博 及 交互 微 博 中 提取 ; 用 
户 关联 兴趣 通过 用 户 与 其 关注 用 户 间 的 关注 关系 强度 、 交 互 频繁 程度 和 个 体 兴 趣 相似 度 获 取 。 最 后 ， 计 算 用 户 扩 展 兴 
趣 与 待 推荐 微 博 的 相似 度 , 对 相似 度 降 序 排 列 产生 推荐 列表 。 实 验 结果 表明 , 新 方法 较 传 统 方 法 更 具有 效 性 和 准确 性 。 
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Microblog recommendation method based on extended interest of users 


Xu Jianming, Liu Mingyan, Wang Miao' 
(School of Cyber Security & Computer, Heibei University, Baoding Hebei 071002, China) 


Abstract: In order to deal with the problem of extracting interest of microblog users inaccurately, this paper proposed a 
microblog recommendation method based on extended interest of users. This method combined individual interest and associated 
interest to represent extended interest for recommending microblogs. It extracted individual interest of users from their tags, 
posted microblogs and interacted microblogs. Then it got associated interest by the strength of following/followed links, 
interaction frequency and individual interest similarity between users and their followee. Finally, calculate the similarity between 
extended interest of users and the microblogs to be recommended, it generated the recommendation lists by descending the order 


of similarity. Experimental results show the method is more effective and precise than the traditional methods. 


Key words: individual interest; associated interest; extended interest; microblog recommendation 


利用 标签 关联 度 和 用 户 的 关注 关系 更 新 用 户 标签 矩阵 ， 得 到 最 


0 引言 终 的 用 户 兴趣 。 上 述 方法 仅 考虑 了 用 户 间 静 态 的 关注 关系 ， 不 
随 着 新 兴 社 交 媒 体 的 流行 , 微 博 已 经 成 为 人 们 分 享 、 传 播 、 能 准确 衡量 用 户 与 其 关注 用 户 的 关系 强度 ， 并 且 关 注 用 户 存在 
获取 信息 的 重要 平台 趾 。 用 户 的 爆炸 式 增长 导致 微 博 平台 产生 与 用 户 不 同 的 兴趣 ， 导 致 提取 的 用 户 兴趣 不 准确 。 微 博 用 户 除 
的 信息 呈 指 数 级 增长 , 信息 过 载 问题 日 益 加 剧 外 。 因此 , 针对 微 ” ”关注 行为 外 ， 还 常常 对 喜爱 的 微 博 进 行 点 赞 、 转 发 和 评论 等 动 
博 用 户 的 潜在 需求 ， 推 荐 其 感 兴趣 的 微 博 变 得 尤为 重要 。 态 的 交互 行为 ， 将 这 些 行为 用 于 提取 用 户 兴 趣 ， 一 方面 能 较 准 
实现 微 博 推荐 的 关键 是 提取 用 户 兴趣 外 。 高 明 等 人 多 利用 。” 确 地 反映 用 户 的 兴趣 ， 另 一 方面 相对 于 静态 的 关注 关系 能 较 好 
LDA 主题 模型 推断 用 户 发 布 微 博 的 主题 分 布 获 取 用 户 兴趣 ; 王 。 ”地 体现 用 户 之 间 的 关联 程度 。 
宁 宁 等 人 四 利用 TextRank 排序 方法 提取 用 户 发 布 微 博 中 的 关键 针对 以 上 问题 , 本 文 考虑 了 用 户 间 的 关注 关系 和 交互 行为 ， 
词 作为 用 户 兴趣 ; Zhou 等 人 [9 通过 构建 用 户 标签 图 表示 用 户 兴 ”提出 一 种 基于 用 户 扩展 兴趣 的 微 博 推荐 方法 。 该 方法 通过 引入 


上 述 方法 从 用 户 自身 信息 中 提取 用 户 兴 趣 ， 取 得 了 一 定 的 。 开关 变量 、 调 和 参数 ， 将 用 户 个 体 兴 趣 和 用 户 关 联 兴趣 融合 得 
推荐 效果 ， 但 均 未 考虑 用 户 间 的 关注 关系 。 理 论 上 ， 关 注 行为 。” 到 用 户 扩 展 兴趣 。 用 户 个 体 兴趣 从 用 户 自 身 信 息 中 提取 ， 所 用 
可 直接 反映 用 户 的 兴趣 导向 外， 将 其 用 于 用 户 兴趣 的 挖 据 是 可 ”信息 包括 用 户 标签 、 用 户 发 布 的 微 博 及 交互 微 博 ， 用户 关联 兴 
行 的。 例如 ， 谭 晋 秀 等 人 名 使 用 K-means 聚 类 方法 对 “特别 关 ” 趣 通 过 用 户 间 的 关联 度 和 关注 用 户 的 个 体 兴 趣 计 算得 到 。 

注 ” 用 户 发 布 的 微 博 进 行 聚 类 ， 提 取 每 类 微 博 中 的 关键 词 作 为 
用 户 兴趣 ; Ma 等 人 外 从 用 户 发 布 的 微 博 中 提取 关键 词 , 将 关键 
词 与 用 户 在 微 博 系 统 中 选择 的 标签 结合 构建 用 户 标签 矩阵 ， 
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1 ”用 户 扩 展 兴趣 


11 用 户 个 体 兴趣 
用 户 个 体 兴 趣 普遍 被 描述 为 用 户 对 各 个 兴趣 词 的 喜好 程度 
09， 可 从 用 户 标 签 、 用 户 发 布 的 微 博 及 交互 微 博 中 提取 关键 词 
来 表示 用 户 的 个 体 兴趣 词 ， 并 用 关键 词 的 权重 表示 用 户 的 喜好 
程度 。 
1.1.1 用 户 标签 表示 
用 户 依据 其 所 在 领域 或 兴趣 爱好 给 自己 添加 标签 0J， 可 以 
选择 添加 微 博 系统 中 提供 的 标签 ， 也 可 以 自 定 义 输入 。 标 签 的 
内 容 包含 一 些 标识 兴趣 和 身份 的 短语 ， 如 “旅行 ”“ 音 乐 迷 ” 
“篮球 爱好 者 ”等 。 用 户 z 的 标签 Pt 表示 为 
Pt, -((t, : fta) (s: fta). s (ty frs) 
其 中 : o n WAP as BR ERAS. fu 73 t, 的 权重 。 对 于 同一 
个 用 户 ， 认 为 用 户 的 每 个 标签 同等 重要 ， 即 —1/n» hM 
P! 的 标签 总 数 。 
1.1.2 用 户 发 布 的 微 博 表示 

微 博 用 户 通过 发 布 微 博 记 录 日 常生 活 、 表 达 自 己 的 观点 ， 
在 一 定 程度 上 ， 用 户 发 布 的 微 博 可 以 表明 其 个 体 兴 趣 021。 而 微 
博 是 典型 的 短文 本 ， 若 使 用 词 频 统 计 关 键 词 ， 效 果 并 不 理想 。 
因此 ， 本 文 将 用 户 近 期 发 布 的 所 有 微 博 拼接 为 一 个 长 文本 ， 然 
后 提取 关键 词 。 
用 户 近期 发 布 的 微 博 拼 接 的 长 文本 Pp, 表示 为 
Pp, =(( Pa © fpa). (Da : Piz) (Pa : foi)); 
其 中 : p 为 从 长 文本 中 提取 的 第 上 个 关键 词 , 1 为 关键 词 总 数 ， 
fp, 为 p, IRE, RAR (1) 计算 。 


A NGx) 
2N (pa) 


(1) 


其 中 : N(p4) 73 p, 在 长 文本 中 出 现 的 次 数 。 

1.1.3 用 户 的 交互 微 博 表示 

用 户 的 交互 微 博 指 其 点 赞 、 转 发 和 评论 的 微 博 。 不 同 交互 

行为 可 反映 用 户 对 微 博 的 喜爱 程度 ， 将 用 户 近 期 点 赞 、 转 发 和 

评论 的 微 博 分 别 拼接 为 三 个 长 文本 Pz 、Pr 和 Pc ， 表 示 为 
Pz - ((za: fei) (2 : fo) (a: fea)) 


Pr, - (Gi : fia) (ro: Jos) fr) 


PG, — (ca : fe). (Ci € fei)» s Qs: fein)) 
其 中 : Zi Tyr Gy 分 别 为 从 Pz.» Pr 和 Pc, 中 提取 的 第 个 
Xl. as fo om MORIA Pz ，Pr 和 Pe 中 提取 的 关键 词 
总 数 ， Fa fno fen 分 别 为 Zg? hp’ Ch 的 权重 , 采用 式 CD 
is. 

将 Pz 、Pr 和 Po, 中 的 关键 词 进行 合并 , JETRE 

WAF u, 的 交互 微 博 Pb 表示 为 

Pb, - (b : fb) (Ba: Ja). (b, fb) 
Jr b, DEP u 交互 微 博 中 的 第 人 个 关键 词 ，s 为 关键 词 总 


pin 


数 ，0<s<at+f+m， fobi 为 bs 的 权重 ,采用 式 (2) 计算 。 
fo =a xwlx fz, +a, x wr x fr, +a xwcx fe (2) 

其 中 ; wil， wr» wc 为 点 赞 、 转 发 和 评论 的 权重 , wl wr wc21» 
a ay a 是 开关 变量 。 若 b, AHP u 点 赞 的 微 博 中 提取 
的 关键 词 ， 则 w 取 1， 否 则 取 0; Eb, 是 从 用 户 转发 的 微 博 
中 提取 的 关键 词 ， 则 w 取 1， 和 否则 取 0; # b, EAH u 评论 
的 微 博 中 提取 的 关键 词 ， 则 w, 取 1， 和 否则 取 0。 

1.1.4 用 户 个 体 兴趣 表示 


定义 1 用 户 个 体 兴 趣 。 用 户 个 体 兴趣 是 从 用 户 自 身 信息 
中 挖掘 的 兴趣 ， 表 示 为 用 户 的 个 体 兴 趣 词 与 其 对 个 体 兴 趣 词 的 


喜好 程度 所 构成 的 二 元 组 向 €. 
P, - (wi : fw) Qv : fw), s Qu: fw,)) « RP w IMA u 
的 个 体 兴 趣 词 , 
Wa € {fiot tn} U {Pio Pas Pa y U {bibit Db} 
， fiwi 为 wi 的 权重 ， 计 算 公式 如 GO BUR. e WHP u, 
的 个 体 兴 趣 词 总 数 ，0 <e<h+l+s。 
fw = Bx ft, + Po X for + Bx fob, G3) 
其 中 ，p ，p,，_p, 是 开关 变量 ， 分 别 标志 w, 是 否 为 用 户 的 


标签 ， 从 发 布 微 博 中 提取 的 关键 词 和 从 交互 微 博 中 提取 的 关键 
词 。 
对 fw, 归 一 化 处 理 ， 最 终 用 户 的 个 体 兴趣 词 w, 的 权重 


fw 计算 公式 如 式 (4) 所 示 。 


' fw 

Pwa = a fo for fo i 
12 用 户 关 联 兴趣 

户 关联 兴趣 受 其 关注 用 户 的 影响 ， 影 响 程度 通过 用 户 与 
其 关注 用 户 的 关联 度量 化 。 

1.2.1 用 户 间 的 关联 度 
JP u, SWP u, 的 关联 度 是 彼此 关联 程度 的 体现 , 由 两 者 
的 关系 紧密 度 和 个 体 兴 趣 相 似 度 共同 决定 , 计算 公式 如 (5) 所 
ZN o 


b 
2 
其 中 : G; 为 用 户 w SMP u HARE. WHY u, 与 用 户 
u 的 关注 度 和 交互 度 共同 决定 ， 计 算 公 式 如 式 6) Wr. L 
KAF u, SHP u, 的 个 体 兴趣 相似 度 , 采用 余弦 相似 度 公式 计 
算 。 


b= (G; *1,) G) 


G; -x( 8) (6) 


其 中 : A AHP u SHP u, 的 关注 度 , 反映 了 彼此 间 的 关注 关 
系 强度 ， 计 算 公 式 如 式 〈7) 所 示 。 


S, DAP u 与 用 户 的 交互 度 ,表现 为 用 户 间 点 赞 、 转 发 和 评 


论 的 频繁 程度 ,计算 公式 如 式 (8) 所 示 。 
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0 5 uu EARE 

A 7105 5 uj5u/É IRE C) 

|o uu MARE 

直观 上 ， 在 微 博 中 ， 三 种 关注 关系 下 用 户 间 的 关注 度 从 小 

到 大 的 次 序 为 : 用 户 间 互 不 关注 的 关注 度 ， 用 户 间 单 向 关注 的 

关注 度 ， 用 户 间 双 向 关注 的 关注 度 , 据 此 ， 本 文 将 4 在 三 种 情 
况 下 的 值 分 别 定 为 0，0.5 和 1。 

S5 = wIx SL, +wrxSR * wcx SC; (8) 

其 中 : SL, ，SR, ，SC; 分 别 表示 用 户 u SAP u, RO SEL 

旷 、 转 发 交互 度 和 评论 交互 度 ， 计 算 方法 如 式 (9) ~ (11) 所 


n 


RE 


CAR a E (9) 


SR = 二 x i p (10) 


SC, ==x| 元 人 + 天 (11) 


Kb: NL> NR > NC, 为 用 户 u AH HIP? us R PRAVE 
AXO ni» ngo ns 为 用 户 u RI PRADERA A SOR 


np， nj4， ns 分别 为 用 户 u 点 赞 、 转 发 和 评论 的 用 户 总 数 。 
1.2.2 用 户 关联 兴趣 表示 
利用 1.2.1 节 中 的 方法 计算 用 户 w 与 其 关注 用 户 的 关联 度 ， 


第 选 出 与 其 关联 度 大 于 一 定 阔 值 的 关注 用 户 吕 , 刀 ,., ， 其 中 
用 户 的 个 体 兴趣 表示 为 


P, -((w; i fw a) wj : fw a) (Wi, Hus ) 5 


定义 2 用 户 关 联 兴趣 。 用 户 关 联 兴趣 是 从 与 用 户 关 联 度 
大 于 一 定 阐 值 的 关注 用 户 中 挖掘 的 兴趣 ， 表 示 为 用 户 的 关联 兴 
趣 词 与 其 对 关联 兴趣 词 的 喜好 程度 所 构成 的 二 元 组 向 量 : 


Q - ((a : faa) (45 : fü)» s (Gi, : fa.)) 


bs g 为 用 


n 

、 — 

M u, 的 关联 兴趣 词 ，gq cn 】 ， 
ja 


向 ,为 g 的 权重 ,计算 公式 如 (12) BER g 为 用 户 的 关联 
兴趣 词 总 数 ， 并 且 0<g< sum, + sum, t «c sum, o 


fa, = YF fw, (2) 


其 中 : y 是 开关 变量 ， E qa 与 wy 表示 同一 个 词 ， 则 y Ex. l, T 
则 取 0。 
对 应 归 一 化 处 理 ， 


最 终 用 户 的 关联 兴趣 词 g 的 权重 


打 计算 公式 如 式 (13) 所 示 。 
fd 


a7 (13 
LECCIONES, i 
13 用户 扩展 兴趣 表示 

定义 3 用 户 扩展 兴趣 。 用户 扩展 兴趣 是 用 户 个 体 兴趣 和 


关联 兴趣 的 调和 结果 ， 表 示 为 用 户 的 扩展 兴趣 词 与 其 对 扩展 兴 
趣 词 的 喜好 程度 所 构成 的 二 元 组 向 量 : 

T, =((d; : fd). (di, : fd). (d, : fd;,)) 
其 中 ，4d， 为 用 户 w 的 扩展 兴趣 词 ， 


i 


d; E (wa ws We} U faida de} » fd, 为 di 的 权重 , 计算 公 


式 如 式 (14) 所 示 ,v 为 用 户 的 扩展 兴趣 词 总 数 , 0<v<e+g。 
fda 2 y A fw + ya(1— A) fa 
(14) 
其 中 : po x AER, y 标志 qd 是 否 为 用 户 u, 的 个 体 兴 
趣 词 ，y, 标识 d, 是 否 为 用 户 u, 的 关联 兴趣 词 。7 为 调和 参数 ， 
Ae[0,1]; HR (14) HA, AROR, fd, = faao BUMP u, 
F7 E A E RO ESE, ET T; 表示 用 
Pu RKA; A1, fdp = fw,o WHA u, 的 扩展 
趣 词 的 权重 与 个 体 兴趣 词 的 权重 相等 E T, KRH u, 的 个 
体 兴 趣 词 。 


2 ” 微 博 推荐 方法 


对 于 新 发 布 的 微 博 ， 计 算 用 户 扩展 兴趣 与 微 博 的 余弦 相似 
度 ， 通 过 相似 度 对 微 博 降序 排列 ， 将 排名 TOP-N 条 微 博 推荐 给 
] 户 。 微 博 表示 为 
M, — ((m, : frm), (m, : fma), (m, : fm, )) 

其 中 : m, 为 从 微 博 中 提取 的 第 个 关键 词 ，fim 为 m 的 权重 ， 
计算 方法 如 式 O) AR, o 为 关键 词 总 数 。 

本 文 微 博 推荐 方法 UEI) 的 具体 过 程 如 算法 1 所 示 。 

算法 1 为 用 户 推荐 TOP-N 条 微 博 
输入 : 用 户 的 标签 向 量 Pt 、 发 布 微 博 向 量 
Pp,、 交 互 微 博 向 量 Pb ， 待 推荐 微 博 向 量 


DYA 
区 


" 


— 


M: Mg ， 用 户 的 关注 用 户 总 数 AQ) ， 
参数 1 
输出 : 用 户 的 TOP-N 推荐 列表 。 


l.for j 2] to n 


Pu, 的 个 体 兴 趣 P 


2. 计算 


3.for j=] ton 

4. for j=1 to A(u) 

5 0 =((00)) 

6.， ”计算 用 户 久 与 的 关联 度 F, 
T. 这 F, >B 5) 


$..— IRI u, KEMOXGR p, 
9. P u, 的 关联 兴趣 Q += F, x P, 


10. for j=] to n 
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14. 


. fort-l to K 
Pu HOA 
计算 工 与 待 推荐 微 博 MX 的 相似 度 


EX T.- AP -(1- 2)Q 


为 P u) 生 推荐 列表 H, 


15. return {Hi,H,,…,H,} 


3 


3.1 


实验 及 分 析 
实验 数据 


因为 目 


3.2 


法 性 


、 美 食 、 


前 没有 统一 、 权 威 的 微 博 数据 集 可 供 使 用 ， 
实验 数据 通过 爬虫 工具 进行 抽取 和 采集 。 首 先 选取 来 自 电影 、 

乐 财经 、 房 产 、 赛 事 和 汽车 八 个 领域 的 40 个 
E 用 户 作为 目标 用 户 ， 利 用 雪 球 采样 的 息 行 策略 ， 顺 着 


评价 标准 


本 文采 


本 文 的 


目标 用 户 的 关注 用 户 链 向 外 疏 行 扩展 一 层 ， 最 终 获 取 3087 个 
十 用 户 自 2018 年 3 月 22 HJ 2018 Æ 6 H 21 日 发 布 、 点 
评论 的 微 博 数据 ， 共 计 137 945 条 。 此 外 ， 
据 还 包括 这 些 用 
的 微 博 推 
300 条 热门 微 博 


实验 数 


户 的 标签 及 用 户 之 间 的 关注 关系 。 为 实现 最 终 
荐 ， 搜 集 了 2018 年 6 月 22 日 到 2018 年 6 月 
作为 待 推荐 微 博 。 


24 日 的 


平均 倒数 排名 MRR PMAR P 作为 评价 推荐 方 
能 的 标准 。 


平均 倒数 排名 MRR 表示 top-N 推荐 列表 中 第 一 条 正确 微 


EN 


(15) 所 示 。 


其 中 : n 为 目 
正确 微 博 所 在 位 置 。 
AER P 为 用 户 感 兴趣 的 微 博 在 推荐 列表 中 所 占 比例 ，P 


MRR = 1 1 
ni rank, 


博 所 在 位 置 的 倒数 均值 , MRR 值 越 高 , 表示 用 户 感 兴趣 的 微 博 
E 荐 列表 中 的 排名 越 千 前， 推荐 顺序 越 合理 ， 计 算 公 


式 如 式 


(15) 


标 用 户 总 数 ，rank 为 用 户 的 推荐 列表 中 第 一 条 


ERA. KIH 


住 荐 方法 的 准确 率 越 高 。 


33 ”参数 及 阅 值 设置 
1) 交互 行为 权重 
点 赞 、 转 发 和 评论 的 权重 采用 层次 分 析 法 (AHP) 


比较 和 矩阵 和 一 
比较 ， 得 到 的 
3.0183， 对 应 
向 E obs dE 


中 成 对 


致 性 检验 的 方法 确定 。 对 wl ，wr ，wc 进行 两 两 


化 ， 得 到 标准 化 后 的 向 


判定 矩阵 如 表 1 所 示 。 判 定 矩 阵 的 最 大 特征 值 为 
的 特征 疝 量 为 ，w = (0.1862,0.8527,0.4881) ， 将 该 


ji 


4 


T 


=(0.1219,0.5584,.0.3197)， 其 每 一 维 的 值 分 别 对 应 点 赞 、 转 发 


Ri 


F 论 的 权重 ， 即 wl 20.1219, wr 20.5584, wc = 0.3197 o 


表 1 判定 矩阵 


影响 因素 wl Wr wc 
wl 1 1/4 1/3 
wr 4 1 2 
wc 3 1/2 1 


2) KEKERE 


X 


um 


YE Hi P SERRE H A I DOE E MB E 2 2D E B 
户 与 用 户 
行为 ， 个 体 兴趣 完全 不 同时 ， 
CI) (8) 分 别 计算 可 得 上 述 情 况 下 两 
交互 度 为 0; 然后 ， 将 上 述 结果 代入 式 (6) 计算 得 到 


户 uj; 的 关系 紧密 度 为 0.25; 最 后 , 将 用 户 u, 


首先 ， 


用 户 
与 用 户 的 关系 


(Hg. 
u, 是 单 向 关注 关系 , 没有 点 赞 、 转 发 和 评论 的 
两 者 的 关联 度 最 小 。 
者 的 关注 度 为 


0.5, 
"- 


紧密 度 0.25 和 个 体 兴趣 相似 度 0 代入 式 (5) 可 得 两 者 的 关联 


度 为 0.125， 故 将 用 户 间 的 关联 度 闵 值 5 设 
3) JF 


[参数 


的 实验 数据 集 ， 通 过 反复 实验 来 确定 参数 4 的 取 


用 于 调和 用 户 个 体 兴 趣 和 关联 兴趣 所 占 比 重 。 
用 户 个 体 兴 趣 所 占 比重 越 大 ， ah, 用 
昌 集 下 参数 1 的 取 值 应 该 不 


标注 法 ， 对 40 个 标 用 户 感 兴趣 


4=0， 


趣 的 微 博 进 行 标注 ， 
0.1,0.2,...,0.9,1 时 本 文 的 推荐 方法 在 top-20 推荐 结果 下 的 


性 能 指标 ， 结 果 如 图 1 所 示 。 


性 能 指标 值 


0 0.2 0.4 0.6 08 1 


1 不 同 4 下 MRR 值 和 P 值 的 对 


为 0.125。 


pin 


A ER 


户 关联 兴趣 所 占 
同 ， 针 对 本 文 
B. KHAT 


计算 


从 图 1 可 以 看 出 , 当 4=0.7 时 ， MRR 值 和 P 值 均 达到 最 


大 ， 故 后 续 实 3 
趣 完 全 
兴趣 所 


明显 ， 


3.4 ”实验 对 比 结果 
为 验证 微 博 
进行 两 项 对 


成 影响 ， 实 


HK 4 设置 为 0.7。 
取决 于 关联 兴趣 ; Iona 
占 比 重 增 大 ， 关 注 用 户 的 个 体 兴 趣 对 用 
扰 逐 渐 减 小 , P 值 和 MRR 值 逐 渐 增 大 , 即 推 
当 07<&<1 时 , 随 着 4 的 增 大 , 用 户 自身 数据 不 足 表现 越 来 越 
结果 逐渐 降低 。 


3L, 


ENT 


E 1P RP ROX ZN 


0.7 时, 随 着 4 的 增 大 , 个 体 


荐 


户 个 体 兴趣 的 二 
效果 逐渐 提升 ， 


推荐 方法 的 有 效 性 


比 实验 ， 第 一 项 实验 用 于 比较 单独 基于 


和 准确 性 ， 


n 


在 本 文 数 


ERE 


JPAMAEAX 


趣 (UPD 、 用 户 关 联 兴趣 (UAD 和 两 者 融合 CUED 的 微 博 
推荐 方法 的 性 能 。 


考虑 到 推荐 微 博 数 的 不 同 会 对 推荐 的 性 


能 造 


"Ur 


验 在 推荐 列表 长 度 为 5、10、15 和 20 时 观察 推 
法 的 性 能 , 图 2 和 3 为 三 种 方法 在 top-5, top-10, top-15 和 top- 
E 荐 结果 下 的 MRR 值 和 P 值 。 
1 
ww 0.6 IN UPI 
Š 0.4 ps 2 UAI 
0.2 小 m UEI 
0 FRE "i A LIV 
TOP-5 TOP-10 TOP-15 TOP-20 
图 2 不 同 推荐 结果 下 MRR 值 的 对 比 
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Se 徐 建 民 ， 等 : 基于 用 户 扩展 兴趣 的 微 博 推 荐 方法 
4 ”结束 语 
0.8 
0.6 QUPI MT" -- " 
B od md 本 文 对 微 博 推荐 方法 进行 了 研究 ， 在 考虑 用 户 个 体 兴趣 的 
o2 SUEI 基础 上 ， 结 合用 户 关联 兴趣 ， 提 出 一 种 基于 用 户 扩展 兴趣 的 微 
3 博 推荐 方法 。 该 方法 使 提取 的 用 户 兴趣 更 加 准确 ， 并 在 一 定 程 


TOP-5 TOP-10 TOP-15 TOP-20 
度 上 解决 了 提取 不 活跃 用 户 兴 趣 困难 的 问题 。 实 验 表明 ， 本 文 


图 3 ”不同 推 荐 结果 下 了 值 的 对 比 提出 的 方法 相对 于 以 往 的 CB 算法 和 ITCAUSR 算法 有 较 优 的 
从 实验 结果 可 以 看 出 : a) 采用 基于 用 户 个 体 兴 趣 CUPI) 生 能 。 然 而 ,本 文 仅 结合 关注 用 户 的 兴趣 来 获取 用 户 扩展 兴趣 ， 
较 基 于 用 户 关 联 兴趣 UAD 的 微 博 推荐 方法 性 能 较 优 , 说 明 用 ”没有 考虑 用 户 的 粉丝 、 与 其 存在 交互 行为 的 非 关 注 用 户 对 甚 兴 
户 的 关联 兴趣 只 是 作为 用 户 个 体 兴趣 的 补充 ， 忽 略 个 体 兴趣 会 。 趣 的 影响 。 因 此 ， 确 定 上 述 用 户 的 兴趣 是 否 可 以 作为 用 户 扩 展 
导致 推荐 效果 不 理想 ; b) 本 文 提 出 的 基于 用 户 扩展 兴趣 的 微 博 。 ”兴趣 的 一 部 分 将 是 下 一 步 研 究 工 作 中 的 重点 。 
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